ارائه رهیافتی جدید برای تولید پیکره موازی انگلیسی-فارسی

پایان نامه
چکیده

در این پژوهش، برای اولین بار مدلی ترکیبی برای تراز بندی جملات، جهت ساخت پیکره های موازی انگلیسی-فارسی ارائه شده است. در حالت کلی چارچوب روش پیشنهادی، غیر وابسته به زبان های مبدأ و مقصد بوده و از آن می توان برای تولید پیکره های موازی، برای هر جفت زبان دیگر، نیز استفاده کرد. نتایج بدست آمده از پیاده سازی ها نشان می دهد که بکار بردن ویژگی های زبانی و غیر زبانی ، عملکرد سیستم را تا حد قابل قبولی بهبود خواهد بخشید. همچنین در این تحقیق میزان تأثیر استفاده از شباهت های طولی، ترجمه تحت اللفظی و نقش دستوری کلمات، به صورت مستقل یا ترکیبی، برای عملیات ترازبندی مورد بررسی قرار گرفته است. بکارگیری طبقه بندهای سلسله مراتبی در تشخیص نوع تراز بندی به عنوان یکی از شاخص های اصلی سیستم پیشنهادی محسوب می شود که موجب بالا رفتن دقت وسرعت عملیات تولید پیکره نسبت به سایر مدل ها می شود. از ویژگی های دیگر این روش، قابلیت توسعه پذیری آن است. به این ترتیب که می توان با گنجاندن خصوصیاتی (در بدنه بردارهای ورودی) که ممکن است در آینده برای تشخیص بهتر نوع تراز بندی مورد توجه قرار گیرند کیفیت سیستم ترازبندی را ارتقاء بخشید. با این حال، چالش اساسی این رهیافت و بسیاری از روش های پیشین، وجود سلایق متنوع در ترجمه متون است. این مسئله در برخی موارد موجب تولید جملاتی می گردد که مشابهت آن ها با متن اصلی در حد معنا بوده و تنها قابل درک و تشخیص برای انسان می باشد. در چنین وضعیتی کار استخراج جفت عبارات معادل، بسیار دشوار است. علاوه براین در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمی باشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی

Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...

متن کامل

ارائه های علمی انگلیسی و فارسی: بررسی چگونگی تفکیک مطالب مهم از کم‌اهمیت در پیکره های سخن و بیس

هدف از انجام این پژوهشِ پیکره­محور، بررسی چگونگی جداسازی مطلب ­های بااهمیت از کم­اهمیت در ارائه­ های علمی انگلیسی و فارسی است. مقاله حاضر کوشیده­است تا نشانگرهای مطالبِ­ بااهمیت را از نظر نقشی که در ارائه دارند، دسته­بندی نماید. به این منظور، از روش تحقیق ترکیبی بهره گرفته شده­است. به منظور یافتن نشانگرهای مطلب­های بااهمیت، 160 ارائه در پیکره بیس و 60 ارائه در پیکره فارسی سخن، موردبررسی قرار گرفت...

متن کامل

پیکره متنی تطبیقی فارسی-انگلیسی حوزه تخصصی فاوا

در زبان شناسی، پیکره انباره­ای از داده ­های متنی است. در این مقاله، تمرکز ما بر طراحی و ساخت خودکار پیکره دو زبانه فارسی-انگلیسی است. ما نرم افزاری برای ساخت پیکره طراحی کرده­ ایم که هزینه و زمان ساخت پیکره را کاهش می­ دهد؛ به­ علاوه نرم­افزار ارائه شده قابلیت مدیریت پیکره را نیز برای کاربران فراهم می­ کند. در این مقاله، روشی برای ترازبندی جمله های پیکره فارسی تخصصی حوزه فاوا  و جملات انگلیسی پ...

متن کامل

ساخت پیکره ی دوزبانه موازی انگلیسی- فارسی و کاربرد آن در سامانه حافظه ترجمه (مبحثی در زبانشناسی پیکره ای)

در حال حاضر برونداد سامانه های ترجمه ماشینی نیاز به پس ویرایش دارد. در ترجمه ماشینی خودکار امکان دخالت کاربر حین کار وجود ندارد و مترجم پس از بروز خطا به رفع آن می پردازد. ابزارهای ترجمه می توانند با ایجاد محیطی تعاملی رفع خطاها را قبل از انتقال به برونداد ممکن سازند. مهمترینِ این ابزارها, سامانه های حافظه ترجمه هستند که از متون موازی همترازشده استفاده می کنند. فنون همترازسازی خودکار مورد استفاد...

15 صفحه اول

ارائه یک الگوریتم جدید برای پارک موازی خودرو مبتنی بر طراحی مسیر با انحنای پیوسته کلوتوئید

یکی از دستاورد‌های صنعت خودرو در سال‌های اخیر اضافه نمودن سیستم انجام پارک خودوند خودرو می‌باشد که این سیستم میتواند بدون دخالت یا با راهنمایی انسان خودرو را در محل مورد نظر پارک نماید. در این مقاله با ارایه یک الگوریتم جدید سعی شده تا با استفاده از خواص منحنی کلوتوئید، مسیر قابل پیمایشی برای حرکت خودرو به سمت جایگاه پارک طراحی شود. حرکت خودرو در این مسیرِ هموار به صورت پیوسته، با سرعت ثابت و ای...

متن کامل

ساخت پیکره تطبیقی فارسی-انگلیسی و استخراج جملات موازی از آن

کیفیت بسیاری از کاربردهای پردازش زبان های طبیعی مانند سیستم های ترجمه ی ماشینی به پیکره های موازی که برای آموزش آنها استفاده می شود، بسیار وابسته است. بنابراین یکی از نیازهایی که در این حوزه وجود دارد، تهیه ی پیکره های موازی با حجم داده ای بالا و محتوای متنوع می باشد. مشکلی که در استفاده از پیکره های موازی وجود دارد، حجم اندک اطلاعات موازی موجود بر روی منابع اطلاعاتی است. در سال های اخیر، تلا...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023